分類法(Classification)是資料探勘與機器學習中重要的算法。分類主要是用來將資料做區分,判斷資料是屬於哪一個類別。從原有的已知類別的資料集進行學習,用來判斷新進的未知類別資料。因為是已知類別的資料集進行學習所以也被稱為監督式學習(Supervised Learning)。
分類法可以分為兩種用法:分析與預測。
分類法用在各式各樣的領域中,像是銀行用來判斷給不給貸款,醫生用來判斷是否有患病,等等。
一般會將原本已知類別的資料集稱為訓練資料集(Traing Data),因為我們想從這些資料中學習,訓練出規則。
會進一步再把已知類別的資料分為訓練資料(Traing Data)與測試資料(Testing Data)。先把留一部分做為測試,用來檢驗訓練模型的好壞。
一般常用的演算法有以下幾種:決策樹、kNN 分類、貝氏分類法、羅吉斯回歸、SVM、類神經網路、類神經網路等等。之後再討論機器學習的時候再把演算法的部分補充。